ارتقای کیفیت دسته بندی متون با استفاده از کمیته دسته بند دو سطحی

Authors

سعید جلیلی

علی اکبر صدری

abstract

امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته بندی خودکار اهمیت وی‍‍ژه ای یافته است. روش های معمول در این زمینه، روش های یادگیری ماشین هستند. روش های بر اساس کمیته کارایی بهتری نسبت به سایر روش ها از خود نشان داده اند. در این مقاله، دو ایده در زمینه کمیته های دسته بند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه ای از مجموعه سندهای آموزشی، ساخته می شوند، ارائه شده است. بر اساس این ایده، ابتدا مجموعه آموزش با یک روش خوشه بندی به چند خوشه، بر اساس مشابهت یا عدم مشابهت کلاس های اسناد آموزشی، تقسیم می شود و سپس از روی هر خوشه از اسناد، یک دسته بند ساخته شده و به عنوان عضو کمیته قرار داده می شود (روش یادگیری اعضای کمیته یکسان است). در ایده دوم ساخت کمیته ای دو سطحی مطرح شده است. در این ایده اعضای کمیته های سطح دوم خود کمیته هایی هستند که بر مبنای ایده اول ساخته می شوند. در ارزیابی ایده اول مشخص شد که افزایش کارایی بر مبنای معیار دقت و معیار بازخوانی در کمیته بیزین ساده نوع اول، بیشتر از سایر کمیته های نوع اول بوده و به ترتیب 12 درصد و 1/5 درصد می باشد. ارزیابی ها در کمیته نوع دوم (برمبنای ایده دوم)، افزایش کارایی را نسبت به کمیته نوع اول نشان می دهند که بیشترین آن نسبت به کمیته rocchio نوع اول بوده، که معیار دقت را در حدود 8/3 درصد و معیار بازخوانی را در حدود 8/18 درصد افزایش داده است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می‌شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می‌تواند در یک، چند و یا هیچ دسته‌ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می‌گیرد. این موضوع می‌تواند در قالب یک ی...

full text

ارائه ی یک مدل جهت دسته‌بندی متون فارسی با استفاده از ترکیب روش های دسته بندی

برای دسته­بندی متن از تکنیک­های استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دسته­بندی اسناد در قالب تعداد معینی از دسته­های از پیش تعیین شده می­باشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دسته­ها قرار می گیرد. این موضوع می تواند در قالب یک ی...

full text

ارتقای کیفیت دسته‌بندی متون با استفاده از کمیته‌ دسته‌بند دو سطحی

امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته‌بندی خودکار اهمیت وی‍‍ژه‌ای یافته است. روش‌های معمول در این زمینه، روش‌های یادگیری ماشین هستند. روش‌های بر اساس کمیته کارایی بهتری نسبت به سایر روش‌ها از خود نشان داده‌اند. در این مقاله، دو ایده در زمینه کمیته‌های دسته‌بند ارائه شده است. ایده اول برمبنای کمیته‌ bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه‌ای از مجموعه سنده...

full text

دسته بندی پرسش ها با استفاده از ترکیب دسته بندها

هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...

full text

ارتقای کیفیت دسته‌بندی متون با استفاده از کمیته‌ دسته‌بند دو سطحی

Nowadays, the automated text classification has witnessed special importance due to the increasing availability of documents in digital form and ensuing need to organize them. Although this problem is in the Information Retrieval (IR) field, the dominant approach is based on machine learning techniques. Approaches based on classifier committees have shown a better performance than the others. I...

full text

ارائه روشی کارا برای دسته بندی مسائل چنددسته ای با رویکرد انتخاب دسته بند

سیستمهای دسته بندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دسته بند سعی می شود تقریب بهتری از یک دسته بند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دسته بند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...

full text

My Resources

Save resource for easier access later


Journal title:
نشریه دانشکده فنی

Publisher: دانشکده فنی

ISSN 0803-1026

volume 41

issue 7 2007

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023